#!/usr/bin/perl -w
use strict;

my $infile = "step2_regulons.csv";
open   IN, $infile;
open  OUT, ">final_TF2Target.xls";
print OUT  "TF\tTarget\tWeight\n";
while(<IN>){
    chomp;
    next if $. <= 3;
    my($TF) = (split/,/,$_)[0];
    my($context) = $_ =~ m/"\[(.*)\]"/;
    $context =~ s/\'//g;
    $context =~ s/\((\S+,\s\S+)\),?\s?/$TF\t$1\n/g;
    $context =~ s/,\s/\t/g;
    chomp $context;
    print OUT "$context\n";
}
close IN;

# 该脚本用于从 step2_regulons.csv 文件中提取出 转录因子对靶基因的权重, 是否需要未知, 因为所在的公司是会提供该文件。
# 需要注意的是： 得到的 final_TF2Target.xls 是会有重复的, 即同一个 TF-Target 组合会有好几个 Weight, 怎么选择就看个人了。